草庐IT

MySQL VARCHAR 长度和 UTF-8

全部标签

ruby - 如何在 Ruby 中将字符串转换为 UTF8

我正在编写一个使用Hpricot的爬虫。它从某个网页下载字符串列表,然后我尝试将其写入文件。编码有问题:"\xC3"fromASCII-8BITtoUTF-8我有在网页上呈现并以这种方式打印的项目:Développementstr.encoding返回UTF-8,因此force_encoding('UTF-8')没有帮助。我如何将其转换为可读的UTF-8? 最佳答案 您的字符串似乎被错误地编码了:"Développement".encode("iso-8859-1").force_encoding("utf-8")#=>"Dév

ruby-on-rails - Ruby on Rails "invalid byte sequence in UTF-8"由于机器人

我有一些由中文机器人触发的错误:http://www.easou.com/search/spider.html当它滚动我的网站时。我的应用程序版本都是Ruby1.9.3和Rails3.2.X这里是堆栈跟踪:AnArgumentErroroccurredinlistings#show:invalidbytesequenceinUTF-8rack(1.4.5)lib/rack/utils.rb:104:in`normalize_params'-------------------------------Request:-------------------------------*URL:

Ruby 将 CSV 文件读取为 UTF-8 和/或将 ASCII-8Bit 编码转换为 UTF-8

我正在使用ruby1.9.2我正在尝试解析包含一些法语单词(例如spécifié)的CSV文件,并将内容放入MySQL数据库中。当我从CSV文件中读取行时,file_contents=CSV.read("csvfile.csv",col_sep:"$")返回的元素是ASCII-8BIT编码的字符串(spécifié变为sp\xE9cifi\xE9),然后像“spécifié”这样的字符串没有正确保存到我的MySQL数据库中。YehudaKatz表示ASCII-8BIT实际上是“二进制”数据,这意味着CSV不知道如何读取适当的编码。所以,如果我尝试让CSV强制编码如下:file_cont

ruby - 检查 ruby 中的字符长度

我陷入了另一种情况:我们的用户输入要存储在变量中的文本。该文本的条件是它只能允许输入25个字符,现在我必须编写一个正则表达式来检查条件,请帮助我解决这个问题。 最佳答案 我认为您可以只使用String#length方法...http://ruby-doc.org/core-1.9.3/String.html#method-i-length例子:text='Thequickbrownfoxjumpsoverthelazydog.'putstext.length>25?'Toomanycharacters':'Accepted'

ruby - 导入csv数据时,如何去掉 "invalid byte sequence in UTF-8"

我们允许用户通过csv导入数据(使用ruby​​1.9.2,因此它是更快的csv)。作为用户数据,当然,它可能没有得到适当的清理。当我们尝试在/index方法中显示数据时,我们有时会收到错误“UTF-8中的无效字节序列”,指向我们显示字段widget.name之一的erb当我们进行导入时,我们希望强制传入的数据有效...是否有一个ruby​​运算符可以将字符串映射到有效的utf8字符串,例如,类似goodstring=badstring.no_more_invalid_bytes“坏”数据的一个示例是char,它看起来像连字符,但不是常规的ascii连字符。我们更愿意将非utf-8字符

ruby-on-rails - 不兼容的字符编码 : ASCII-8BIT and UTF-8

我使用Ruby1.9.2和Rails3.0.5我有以下错误:incompatiblecharacterencodings:ASCII-8BITandUTF-8我认为这与数据库无关。错误发生在View中的这一行(只是一个divhaml调用):#content全栈:ActionView::Template::Error(incompatiblecharacterencodings:ASCII-8BITandUTF-8):21:-flash.eachdo|name,msg|22:=content_tag:div,msg,:id=>"flash_#{name}"23:%div.clear24:

ruby-on-rails - PG::错误:错误:新编码(UTF8)不兼容

我已经从源代码安装了postgresql-9.2.4,现在当我执行时在railsapp中:rakedb:create命令我得到:$bin/rakedb:createRAILS_ENV="test"PG::Error:ERROR:newencoding(UTF8)isincompatiblewiththeencodingofthetemplatedatabase(SQL_ASCII)HINT:Usethesameencodingasinthetemplatedatabase,orusetemplate0astemplate.:CREATEDATABASE"verticals_test"E

ruby - 在 Ruby 中将字符串切成给定长度的 block 的最佳方法是什么?

我一直在寻找一种在Ruby中将字符串分块为给定长度的子字符串的优雅而高效的方法。到目前为止,我能想到的最好的是:defchunk(string,size)(0..(string.length-1)/size).map{|i|string[i*size,size]}end>>chunk("abcdef",3)=>["abc","def"]>>chunk("abcde",3)=>["abc","de"]>>chunk("abc",3)=>["abc"]>>chunk("ab",3)=>["ab"]>>chunk("",3)=>[]您可能希望chunk("",n)返回[""]而不是[]。如果

ruby 1.9 : invalid byte sequence in UTF-8

我正在用Ruby(1.9)编写一个爬虫程序,它使用来自大量随机站点的大量HTML。在尝试提取链接时,我决定只使用.scan(/href="(.*?)"/i)而不是nokogiri/hpricot(主要加速)。问题是我现在收到很多“UTF-8中的无效字节序列”错误。据我了解,net/http库没有任何特定于编码的选项,而且进来的东西基本上没有正确标记。实际处理传入数据的最佳方式是什么?我尝试使用.encode设置替换和无效选项,但到目前为止没有成功... 最佳答案 在Ruby1.9.3中,可以使用String.encode来“忽略”无

ruby - 计数、尺寸、长度……Ruby 中的选择太多了吗?

我似乎找不到关于这个的明确答案,我想确保我理解到“第n级”:-)a={"a"=>"Hello","b"=>"World"}a.count#2a.size#2a.length#2a=[10,20]a.count#2a.size#2a.length#2那么该用哪个呢?如果我想知道a是否有多个元素,那么这似乎并不重要,但我想确保我了解真正的区别。这也适用于数组。我得到了相同的结果。此外,我意识到count/size/length与ActiveRecord有不同的含义。我现在最感兴趣的是纯Ruby(1.92),但如果有人想谈谈AR带来的不同,我也将不胜感激。谢谢!